ACE虚拟歌姬:“工具化”+UGC社区,想要成为音乐版Roblox
导 读
近期,ACE虚拟歌姬宣布完成了数百万美元Pre-A轮融资,知春资本领投,老股东五源资本跟投。
ACE虚拟歌姬由北京时域科技于去年推出,是一款结合了AI歌声合成技术的音乐创作APP,它以AI赋能结合虚拟歌姬的形式,为音乐创作者提供了一个低门槛作曲、作词的平台。
具体来说,ACE虚拟歌姬为用户提供多个AI虚拟歌手,用户可以在ACE的创作工具中,输入歌曲的旋律、歌词,并且选择AI虚拟歌手进行歌曲演唱,“填词玩法”可以让用户在其他用户创作的歌曲旋律上进行二次创作。目前,ACE虚拟歌姬已经达到了上百万的累计用户。
时域科技创始人郭靖日前接受东西文娱访谈时表示,有创作音乐欲望的人可以达到千万级别,而音乐制作长久以来的“高门槛”阻挡了大批有灵感的创作者,AI技术的进步会让音乐制作变得更触手可及。
郭靖表示,目前从创作功能上来看,ACE虚拟歌姬看起来更像是一个移动版的智能化Vocaloid。未来一年里,时域科技一方面将将升级现有创作工具,不止于“AI歌声创作”,要把ACE的创作工具拆分成一个独立的音乐创作引擎ACE Studio,云端化的同时3D化;另一方面,在分发端也就是现在的ACE虚拟歌姬,会对3D化音乐进行分发,不断形成创作与消费的正循环,探索未来音乐消费的新形态。
在时域科技看来,未来,3D虚拟体验会是音乐消费的最终形态。也许,人们可以在虚拟空间中享受音乐,进行交互,甚至实现基于Avatar素材库的UGC生态。
所以,广义地来讲,ACE Studio未来会与传统的DAW(数字音频工作站)和传统的歌声合成引擎一较高低,加上3D体验后,可能还会与3D内容制作引擎有所交集。
郭靖表示,对于北京时域科技而言,工具+社区的产品模式下,公司的目标始终在于致力于用全新的音乐引擎赋能用户进行音乐 UGC 创作和分发,旨在为音乐爱好者提供一个AI赋能的创作平台和社区。随着未来创作与分发生态的成熟,3D音乐体验的落地,时域科技某种程度上有望成为音乐版的Roblox。
ACE虚拟歌姬
工具+社区模式,探索音乐UGC
ACE虚拟歌姬的诞生,始于创始人郭靖对于音乐创作“去工具化”的思考。
作为ACE虚拟歌姬的创始人,郭靖却是Non Tech出身。从数学类专业毕业后,郭靖曾在迅雷、乐逗游戏等公司从事游戏的发行和运营,真正让他着手去做AI的契机,则是2016年的Gap Year。
“那时想要真正看看有哪些新的技术变化,在硅谷见了许多创业者,发现三个热点——VR、AI还有区块链。我在审美上对AI更感兴趣,AI从最开始推动生产力,到后来可以赋能创作,到我们第二次创业时,看到AI生产图像、文字、音乐内容面临着大爆发。”郭靖说道。
在重新自学代码的过程中,郭靖思考着,创造力的本质到底是什么?
郭靖认为,从艺术的发展历史来看,被认为真正能够表达内容的,在古代是极少数的艺术家,你需要经过超长期、非常专业的训练,才能具备技术推开艺术之门。而工具的作用在于,降低门的重量,也就是降低门槛,让更多有才华的人释放从技术的束缚中得以释放。
就音乐创作而言,郭靖自评自己是“一直站在离音乐门槛外一步之遥的人”,从高中时期捧着吉他创作歌曲,到大学组建乐队担任主唱,仍然没有跨过编曲软件的门槛。直到深入学习了编程,郭靖意识到,音乐制作应该难在没有才华上,而不应该是使用工具的熟练度上。
基于此,北京时域科技于去年推出了结合AI歌声合成技术的音乐创作APP ACE虚拟歌姬。产品的出发点就是提供工具降低音乐创作的门槛,促进音乐UGC。
从产品功能来说,用户导入现有BGM后,在播放BGM的同时点击音符录制旋律,配上自作的歌词,通过AI歌声合成技术,虚拟歌姬的演唱让创作者立刻、直观地感受到自己作曲的呈现效果。在制作完成原创歌曲后,创作者可以将其发布在ACE虚拟歌姬的社区平台。
目前,ACE虚拟歌姬的累计用户数达到了上百万,用户以00后、05后为主;创作者数量约为12万,年龄集中在15-22岁的Z世代。在平台上,平均每天会诞生一两千首新歌,曲风涉及古风、二次元、鬼畜等。在TapTap上,ACE虚拟歌姬的评分为9.2,评论数量达到4000。
在ACE虚拟歌姬的优质创作者中首次创作音乐者比例达到了60%,典型如零音乐基础的创作者「與章」已在平台发布超百首原创作品,保留下近30首精选作品。
谈及用户画像,郭靖表示,他们都有一些很好的音乐Sense,也有强烈的音乐创作冲动,虽然一直以来或多或少接触过音乐,比如说唱过歌或谈过琴,但是都没有能够真正编曲,真正把自己的想法变成一个作品,这是他们最主要的特点。
对于外界将其比作移动版Vocaloid的声音,郭靖表示,ACE虚拟歌姬的优势在于更智能化。技术进步在让大家把注意力更少地放在如何工具使用上,而更多地放在如何创作内容上,AI对此有很大的赋能作用。
而据时域科技披露,在目前世界范围内落地的产品中,ACE虚拟歌姬的歌声合成技术达到了全球顶尖的效果,包括了声音延长的自然度和情感丰富度,技术先进与使用便利性上超过其他歌声合成引擎。
据郭靖介绍,当下歌声合成有三个模型:唱法模型、音色模型与声码器模型。一般来说,唱法模型和声码器模型采用的是非深度学习,而ACE却都采用了深度学习。但要知道的是,声码器模型如果采用深度学习,在歌声合成中很难达到稳定可用。而ACE原创了一种结构,借鉴了图像风格迁移的算法思想,用歌声中的基频信号作为最后输出音频的Guidance,解决了这一问题。
也就是说,ACE虚拟歌姬使用了一种有风险,却更有前景的模型,通过团队不断优化,使 AI歌声合成会变得更自然、更逼真,而事实证明这一冒险有了不错的效果。
工具化
打造音乐引擎ACE Studio
目前所展现的ACE虚拟歌姬的AI歌声合成引擎仅仅是音乐UGC生态的起点,郭靖表示,接下来将要把它升级成一个桌面端的音乐创作引擎ACE Studio,达到类似使用石墨文档那样随开随用的状态。
在郭靖看来,目前传统音乐创作的主流工具DAW有诸多问题待解决,如所有DAW几乎都不在中国售卖、需要付费本地下载大量音源、从无到有创作音乐难度太大等等,这些问题导致音乐创作的门槛极高且创作效率低下。接下来,ACE Studio的革新将包括如下特征:
1)重塑设计降低使用门槛
长久以来,编曲的门槛被小部分“专业人士”所建立,要完成一首编曲不仅要精通一到两门乐器和乐理,还要懂得操作复杂的DAW,如Logic Pro、Cubase、Fl Studio等。此外,还有获得音源、请人录音的代价太大等痛点。
对于很多音乐人来说,使用DAW音乐创作软件这件事情本身的门槛几乎与编程差不多,它天然地认为你需要一些庞大而复杂的知识。ACE Studio首先想要降低的是入门爱好者的认知和使用成本,把最重要、精炼的功能放在主要位置,让使用界面更友好。但这并不会将已入门的专业/半专业音乐人排除在外,ACE Studio的设计将更进一步细分目标人群。
2)AI赋能编曲
就如ACE虚拟歌姬的AI歌声合成将歌声数字化降低创作门槛一样,在ACE Studio的构想中,AI同样可以赋能编曲,这也是目前市面上主流DAW,如Logic Pro、Cubase等所没有做到的。像吉他和弦乐这种连续性乐器,很难用采样音源来编曲,所以很多人都选择实录,效率与成本都极高。
“ACE会将AI编曲做成类似于输入法提词的功能,帮助音乐人在创作过程中生成一些旋律碎片,可以多选、修改,可以通过它获得灵感,通过人机合作的方式快速找到想要的东西。”郭靖说道。也就是说,ACE Studio在创造性和智能化的Trade Off中找到了平衡,是做“问答题”还是“选择题”,甚至在选择题上做自由地修改,这些都由创作者自己选择。
3)云技术解放算力束缚
目前编曲与混音工作上使用的VST插件需要强大的算力带动运行,而ACE计划以云渲染技术,减轻算力负担,意味着高配置电脑也许不再是音乐制作的必需品。
“很多老牌厂商有自己的历史包袱,反而我们后来者可以将其简化,只是技术难点有很多。比如音源如果放在云端,你不用下载和加载,就可以使用。”郭靖说。
在郭靖看来,桌面端的音乐创作引擎ACE Studio与ACE虚拟歌姬的关系,相当于剪映与抖音,创作者的创作内容直接可以分发到ACE社区。和目前展现的手机端虚拟歌姬不同,音乐这种从无到有创作性的内容,有一定的复杂性,在桌面端上操作才是更便捷的。
在推广层面,郭靖表示,“ACE社区中约12万创作者中30%的人有强烈的编曲诉求,我们会邀请社区的种子用户来使用ACE Studio。”
“可能早期他们先是用歌声合成的部分,然后用一些简单的编曲,再叠一个音频伴奏加上一些简单的元素,然后形成作品,更加Pattern Base的原创编曲发到ACE里面。这个过程就是一点点将ACE studio从更强大的歌声合成引擎,变成更强大的音乐创作引擎,需要解决很多问题,至少需要一年的时间。”郭靖表示。
对于整个中国音乐创作市场,郭靖认为音乐创作者的数量应该是千万级的,这意味着对于ACE Studio来说还有很大的空间。
未来音乐消费3D音乐体验?
成为音乐版Roblox
正如郭靖总结的,ACE Studio第一步会是去打造一个具备更新一代云架构、可以共享素材的、有歌声合成能力、软件应用性更高的音乐创作引擎。
而接下来更具想象力的是,时域科技要把ACE studio升级为一个能够创造3D音乐体验的工具。
“这可能是我们非常极端的想象,我们认为现在音乐的媒体形态(media format)是音频文件,用音频文件表示音乐,是一种被阉割的音乐,这种形态将在未来原生3D的互联网世界里面改变。目前3D世界的内容只有游戏,我们一直在思考3D世界中的音乐是什么样子的。最好的方式就是从3D虚拟世界出发去创造它。”郭靖这样解释ACE studio的3D化计划。
在郭靖看来,思考这一问题与元宇宙并没有直接的关联。元宇宙可能让外界看到随着技术的成熟,使得这件事情在现实世界落地成为可能。对于时域科技而言,音乐体验3D化的出发点是给音乐找到一个新的表现形式。“2D世界与视频结合这种表现形式,在短视频平台已经做完了,如果能够找到一个独特的音乐体验,一定是在3D世界的。”
“音乐流媒体平台上的用户对一首新音乐的完播率不到15%,而像YouTube和抖音,某种程度上对人们发现新音乐起了很大的作用。” 不过,郭靖认为,以视频为单位的平台远远不够——只是给音乐贴一个视频,音乐仍是视频平台的子集,但这却可以证明音乐需要结合场景,才能让更多人发现。
如何做3D音乐体验?2011年推出的3D音乐体验《Rome: 3 Dreams of Black》给了郭靖启发。
这是一个基于WebGL技术的互动型MV,随着独立摇滚乐团Danger Mouse and Daniele Luppi全新专辑《ROME》的响起,奔跑的动物、随风摇曳的植物让观众进入了一个3D世界,同时观众可以通过角色操控体验整个MV的故事,完成一场关于梦境的旅行。
在郭靖的想象中,未来的音乐场景化,可能包含的元素有虚拟人,将来每个歌手和音乐人都会拥有自己的Avatar,并且在一个类似舞台的空间中表演,听众可以进入这个空间,与其进行交互与社交。
所以倒推回工具,对于创作者而言,创作者未来可能可以基于ACE studio进行3D音乐体验的创作,在Avatar、特效、场景库等素材库中选择材料,完成3D创作。
郭靖表示,打造音乐引擎的这一年,ACE将同步测试自制的3D音乐体验,将以全新APP的形式进行MVP测试,着重观察用户的完播率。如果某一种体验能够让一首歌的完播率达到50%-70%,那就证明这种3D音乐体验模式有利于人们发现新音乐。
这让ACE虚拟歌姬未来的模式,某种程度上有望成为音乐版Roblox。
在3D游戏平台Roblox的逻辑下,创作端与分发端是统一的,ACE Studio也将遵循这一生态。从创作端来看,Roblox对入门者做到了“去工具化”,同时保留了自主编码的空间。ACE Studio用户将以AI能力和pattern借鉴作为工具,在平台中进行音乐创作,也保留了用户自主修改的空间。从分发端来看,创作者制作的游戏直接在Roblox上线,并不借助于第三方平台。同样,用户在ACE Studio中制作的音乐和pattern也将直接发布于同一平台上。
郭靖表示,一直以来,无论评价时域科技为音乐版的Roblox还是音乐版的快手,他们的本质都是一样的——创造一种全新的工具赋能音乐创作者去创造一种全新的内容形态,这个全新的内容形态被证明有消费性,最终形成了UGC创作与消费的正循环。
“技术只是一个单点,它往往具有时间优势、先发优势,但很难形成壁垒,系统才是壁垒。对于我们而言,这个系统是一个UGC的系统,当创作者与消费者都在构成一个双边网络,就会形成马太效应。”谈及核心竞争力,郭靖表示。